Day 09 - Trino 地端架設與調參 (三) - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 9

AI & Data

動不動就要 ETL? 以Trino為例-淺談從資料倉儲到湖倉系列第 9 篇

Day 09 - Trino 地端架設與調參 (三)

17th鐵人賽

bennyxu0624

2025-08-19 00:12:44

404 瀏覽

分享至

Fault-tolerant 設置

在開始設定不同資料源 Catalog 之前，必須先補充上一篇 config.properties裡被我略過的設定，也就是 Trino 鼎鼎有名的容錯機制 — Fault-tolerant。

Trino Fault-tolerant 機制 (source)

此機制將 Trino cluster 故障時執行到一半的查詢資料「捲」( spool ) 到外部儲存 ( 如AWS S3 ) 中，並分配給未陣亡的 worker 重試，避免讓前段查詢做白工，借用 Starburst 文檔的圖就是深藍色線的部分。

所以可知 Fault-tolerant 有兩個部分需要配置 :

重試政策 ( retry-policy ) :
告訴 Trino 在有 worker 壞掉時要怎麼進行查詢重試，分兩種方式：
- retry-policy=QUERY 即整個查詢從頭再來一次，適合使用情境多為小於 32 MB 、低延遲的「小」查詢
- retry-policy=TASK 即只重跑失敗的 *task，適合使用情境多為大於 32 MB、需長時間處理的批次任務、「大」查詢
暫存資料管理 ( exchange manager ) :
若重試政策為 Task，則須對 exchange manager 做配置，在 Trino cluster 成員們的 exchange-manager.properties 檔案裡，可以對失敗查詢暫存資料的存放方式、存放地點做設定，本文是以 AWS S3 當作例子 :

# exchange-manager.properties
exchange-manager.name=filesystem
exchange.base-directories=s3://sldatacenter-trino-fault-tolerant-development
exchange.s3.region=ap-southeast-1
exchange.s3.aws-access-key=${ENV:AWS_ACCESS_KEY_ID}
exchange.s3.aws-secret-key=${ENV:AWS_SECRET_ACCESS_KEY}